基于云的超級計算是指在云端執行高性能計算,允許多個用戶共享一臺超級計算機,同時確保每個工作負載的隱私和安全。
基于云的超級計算機如何工作?
云原生超級計算機的架構比傳統超級計算機具有更高效的性能。它們并行管理計算和通信,使繁重的工作負載能夠更順暢地處理。那是因為他們使用三種處理器——CPU、DPU 和通常是 GPU 的加速器。讓我們檢查一下這三個中的每一個的作用。
- CPU: CPU 是為需要快速串行處理的算法部分構建的。然而,由于超級計算中的計算任務要復雜得多,CPU 通常會承擔管理越來越大和復雜的系統所需的越來越多的通信任務層。事實上,在傳統的超級計算機上,計算工作有時需要等待 CPU 處理通信任務。
- DPU: DPU,即數據處理單元,是一種片上數據中心平臺,可提供基礎設施服務、管理所有配置、虛擬化和硬件。它為每個超級計算節點提供了兩種新功能:一種是啟用裸機多租戶,另一種是啟用裸機性能。在第一種情況下,基礎設施控制平面處理器保護計算節點的用戶訪問、存儲訪問、網絡和生命周期編排。在第二種情況下,隔離的線速數據路徑允許硬件加速。這允許 CPU 卸載例行任務,而是專注于處理任務,從而最大限度地提高整體系統性能。
- GPU:云原生超級計算中的GPU充當通用協處理器引擎。他們使用圖形處理單元通過并行運行多個搜索來加速在 CPU 上運行的應用程序。
超級計算與云計算
超級計算和云計算之間的區別純粹是規模的衡量標準。雖然企業云計算為企業創造了吸引客戶的新方式并顛覆了組織管理數據、DevOps 和整體 IT 運營的方式,但超級計算將研發(研發)速度和產品開發速度提高了幾個數量級。很簡單,通過每秒處理數萬億次操作,超級計算改變了創新的步伐和動力。
云計算將整套計算服務——服務器、存儲、數據庫、網絡、軟件、分析和智能——帶到了互聯網上。任何類型的計算服務都托管在云中,而不是使用本地環境,這樣多個用戶可以隨時同時訪問它們,而沒有容量過載的風險。這創造了一個全新的可擴展性和效率的世界,繼續使組織能夠實現運營現代化。
將超級計算機的巨大處理能力與云的規模和內在聯系的自然聯系起來,為科學和工程開辟了一個全新的可能性領域。云原生超級計算支持從軟件到藥物再到原型的快速模擬,加快了公司將新產品創新商業化的步伐,科學家們可以在健康、空間、能源等領域取得突破。